Discretization of continuous features について

Words near each other

・ Diseius
・ Diselenide
・ Diselma
・ Disembarkation
・ Disembodied
・ Disembodied (Buckethead album)
・ Disembodied (Rottrevore album)
・ Discretionary policy
・ Discretionary review
・ Discretionary spending
・ Discretionary trust
・ Discretionary trusts and powers in English law
・ Discretitheca
・ Discretization
・ Discretization error
・ Discretization of continuous features
・ Discretization of Navier–Stokes equations
・ Discriminant
・ Discriminant function analysis
・ Discriminant of an algebraic number field
・ Discriminant validity
・ Discriminated union
・ Discrimination
・ Discrimination (disambiguation)
・ Discrimination (Employment and Occupation) Convention
・ Discrimination against atheists
・ Discrimination against Chinese Indonesians
・ Discrimination against girls in India
・ Discrimination against people with HIV/AIDS
・ Discrimination against the homeless

Dictionary Lists

mini英和辞書

翻訳と辞書　辞書検索 [ 開発暫定版 ]

スポンサードリンク

Discretization of continuous features ：ウィキペディア英語版

Discretization of continuous features
In statistics and machine learning, discretization refers to the process of converting or partitioning continuous attributes, features or variables to discretized or nominal attributes/features/variables/intervals. This can be useful when creating probability mass functions – formally, in density estimation. It is a form of discretization in general and also of binning, as in making a histogram. Whenever continuous data is discretized, there is always some amount of discretization error. The goal is to reduce the amount to a level considered negligible for the modeling purposes at hand.
Typically data is discretized into partitions of ''K'' equal lengths/width (equal intervals) or K% of the total data (equal frequencies).〔
〕
Mechanisms for discretizing continuous data include Fayyad & Irani's MDL method,〔Fayyad, Usama M.; Irani, Keki B. (1993) , ''Proceedings of the International Joint Conference on Uncertainty in AI'' (Q334 .I571 1993), pp. 1022-1027〕 which uses mutual information to recursively define the best bins, CAIM, CACC, Ameva, and many others〔Dougherty, J.; Kohavi, R. ; Sahami, M. (1995). "(Supervised and Unsupervised Discretization of Continuous Features )". In A. Prieditis & S. J. Russell, eds. ''Work''. Morgan Kaufmann, pp. 194-202〕
Many machine learning algorithms are known to produce better models by discretizing continuous attributes.
== See also ==

* Density estimation
* Continuity correction

抄文引用元・出典: フリー百科事典『ウィキペディア（Wikipedia）』
■ウィキペディアで「Discretization of continuous features」の詳細全文を読む

スポンサードリンク

翻訳と辞書 : 翻訳のためのインターネットリソース